কৃত্রিম বুদ্ধিমত্তা (AI) এবং মেশিন লার্নিং (ML) মডেল তৈরির পর, সেগুলির কার্যকারিতা বা পারফরম্যান্স মূল্যায়ন করা অত্যন্ত গুরুত্বপূর্ণ। Mean Squared Error (MSE) এবং R-Squared (R²) হল দুটি জনপ্রিয় পরিমাপক যা রিগ্রেশন মডেলের কার্যকারিতা মূল্যায়ন করতে ব্যবহৃত হয়।
Mean Squared Error (MSE) হল একটি পরিমাপক যা রিগ্রেশন মডেলের ত্রুটি বা Error (অথবা ভুল পূর্বাভাস) পরিমাপ করে। এটি প্রকৃত মান এবং পূর্বাভাস করা মানের মধ্যে পার্থক্যের বর্গের গড়। ছোট MSE মান ভাল মডেল নির্দেশ করে, কারণ এর মান যত কম হবে, মডেলটির পূর্বাভাস তত সঠিক হবে।
MSE=1nn∑i=1(yi−^yi)2
যেখানে:
from sklearn.metrics import mean_squared_error
# প্রকৃত মান (Actual values)
y_actual = [3, -0.5, 2, 7]
# পূর্বাভাস মান (Predicted values)
y_pred = [2.5, 0.0, 2, 8]
# MSE গণনা করা
mse = mean_squared_error(y_actual, y_pred)
print(f'Mean Squared Error: {mse}')
R-Squared (R²) বা কোঅফিসিয়েন্ট অব ডetermination হলো একটি পরিমাপক যা মডেলটির পূর্বাভাসের সাথে প্রকৃত মানের কতটা সম্পর্ক রয়েছে তা পরিমাপ করে। R² পরিমাপক ০ এবং ১ এর মধ্যে থাকে:
R2=1−∑ni=1(yi−^yi)2∑ni=1(yi−ˉy)2
যেখানে:
from sklearn.metrics import r2_score
# প্রকৃত মান (Actual values)
y_actual = [3, -0.5, 2, 7]
# পূর্বাভাস মান (Predicted values)
y_pred = [2.5, 0.0, 2, 8]
# R² গণনা করা
r_squared = r2_score(y_actual, y_pred)
print(f'R-Squared: {r_squared}')
বৈশিষ্ট্য | Mean Squared Error (MSE) | R-Squared (R²) |
---|---|---|
মূল্য পরিসর | ০ থেকে ∞ পর্যন্ত (সবসময় ধনাত্মক) | ০ থেকে ১ পর্যন্ত, কখনও কখনও নেতিবাচকও হতে পারে |
কী পরিমাপ করে | মডেল দ্বারা পূর্বাভাসের ত্রুটি (error) পরিমাপ করে | মডেলটি কতটা সঠিকভাবে ডেটার ভ্যারিয়েন্স ব্যাখ্যা করে |
তথ্য ভরসাযোগ্যতা | আউটলায়ারের প্রতি সংবেদনশীল (Sensitive to outliers) | আউটলায়ারের প্রতি কম সংবেদনশীল (Less sensitive) |
বড় মানের অর্থ | ত্রুটি বেশি, মডেল ভালো নয় | R² মান ছোট হলে মডেল কম সঠিক |
ছোট মানের অর্থ | মডেল অধিক সঠিক এবং ছোট ত্রুটি (বেশি মানের পার্থক্য না থাকলে) | R² মান বড় হলে মডেল ভালো |
Mean Squared Error (MSE) এবং R-Squared (R²) হল দুটি গুরুত্বপূর্ণ মেট্রিক যা রিগ্রেশন মডেলগুলির কার্যকারিতা পরিমাপ করতে ব্যবহৃত হয়। MSE ত্রুটি পরিমাপ করে এবং ছোট মানে ভাল মডেল নির্দেশ করে, যখন R² মডেলটির কতটা সঠিকভাবে ডেটার ভ্যারিয়েন্স ব্যাখ্যা করছে তা পরিমাপ করে, এবং উচ্চ R² মান ভাল মডেল নির্দেশ করে। দুইটি মেট্রিক একসাথে ব্যবহার করলে মডেলের উন্নয়ন এবং মূল্যায়ন সহজ হয়।